Асирян Александр Камоевич, 428 группа Все сообщения пользователя объединяются в одно. Далее с помощью TextStats и двух CountVectorizer'ов выделяются признаки. TextStats выделяет количество глассных, различных знаков препинаний и предложений. Далее признаки подаются на вход TfidfTransformer'у. Классификатор - Passive Aggressive. Были рассмотрены как другие классификаторы, так и другие параметры выбранного. С помощью GridSearchCV и cross_validation(StratifiedKFold(n_folds=10)) был выбран лучший из них. http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.PassiveAggressiveClassifier.html